在一路高歌猛進(jìn)之後,大模型最近似乎有點(diǎn)累了。scaling law驅動(dòng)的參數(shù)上升斜度呈現(xiàn)出趨緩跡象,訓(xùn)練與推理的價(jià)格戰也如火如荼,技術(shù)創(chuàng)新的狂熱期也許臨近尾聲。
率先提出「技術(shù)成熟度」曲線(xiàn)的Jackie Fenn曾指出,創(chuàng)新活動(dòng)受人的本性和技術(shù)演進(jìn)的內(nèi)在規(guī)律雙重影響——鐘形曲線(xiàn)描述炒作的影響,S形曲線(xiàn)反映技術(shù)發(fā)展軌跡,二者相互作用不斷將創(chuàng)新推向「命運(yùn)的岔路口」。
當(dāng)下,大模型正處於這樣的節(jié)點(diǎn)。伴隨鋪天蓋地的炒作告一段落,大模型前行的路口上掛著五花八門(mén)的標(biāo)識:選擇開(kāi)源還是閉源,主攻ToC抑或ToB,繼續(xù)「卷」技術(shù)參數(shù)與拼命降使用門(mén)檻哪個(gè)優(yōu)先,追逐通用智能的夢想和紮根行業(yè)場(chǎng)景的實(shí)踐到底能否「兼容」?
這些問(wèn)題都沒有標(biāo)準(zhǔn)答案,此刻的抉擇需要大智慧。曾多次面臨戰略決策考驗(yàn)的「經(jīng)營(yíng)之神」稻盛和夫給出的建議是,「堅(jiān)持做難而正確的事」。在大模型領(lǐng)域,其實(shí)也有上述理念的踐行者,盤(pán)古大模型就是選擇「難而正確」道路的典型代表。
所謂「正確」是指能準(zhǔn)確判斷大模型在複雜內(nèi)外部環(huán)境下亟待解決的主要矛盾,認(rèn)識到由千行萬(wàn)業(yè)組成的ToB市場(chǎng)才是大模型施展身手的主賽道;而「難」則是指行業(yè)智能化轉(zhuǎn)型水深浪大,在複雜、多元的應(yīng)用場(chǎng)景謀求突破,將大模型的技術(shù)創(chuàng)新能力真正轉(zhuǎn)化為新質(zhì)生產(chǎn)力,可謂任重而道遠(yuǎn)。
華為常務(wù)董事、華為雲CEO張平安一旦踏上這條路,就不會(huì)停下腳步。在華為開(kāi)發(fā)者大會(huì)2024(HDC 2024)舉辦期間,華為雲重磅發(fā)布盤(pán)古大模型5.0,在全系列、多模態(tài)、強(qiáng)思維三方面帶來(lái)全新升級(jí),並推出大模型混合雲十大創(chuàng)新技術(shù),為大模型在行業(yè)市場(chǎng)加速落地注入澎湃動(dòng)力。尤值一提的是,盤(pán)古大模型積極應(yīng)對(duì)傳統(tǒng)和新興行業(yè)場(chǎng)景的各類(lèi)高難度挑戰,在「難而正確」的路上樹立起一座座裡程碑。
從某種意義上講,「難」是「五彩斑斕的黑」,其總是轉(zhuǎn)化為不同維度或係數(shù)的障礙。盤(pán)古大模型跨越「欄杆」的方法與路徑,值得業(yè)界借鑑。
高複雜性的「難」:大模型如何破解「薛丁格的貓」
事實(shí)上,很多行業(yè)場(chǎng)景相當(dāng)於一個(gè)複雜系統(tǒng),其中的變量眾多且關(guān)係錯綜,難以用線(xiàn)性的推理找到解決方案。在打開(kāi)「盒子」之前,裡面的「貓」可能處在「生死疊加」的未知狀態(tài),這對(duì)大模型的算法和精度提出前所未有的要求。
在鋼鐵行業(yè),高爐被稱(chēng)作AI落地最難的應(yīng)用場(chǎng)景。其一,高爐是個(gè)5000m³的高溫超大黑箱反應(yīng)器,固液氣三相併存,物理化學(xué)變化繁多;其二,高爐煉鐵過(guò)程涉及的變量類(lèi)型混雜,變量之間有多重相關(guān)性;其三,只能通過(guò)外部傳感器間接感知爐內(nèi)變化,數(shù)據(jù)採集存在較大誤差;其四,各變量的反應(yīng)周期也不同,高時(shí)滯性和多時(shí)滯性互相耦合。
作為全球規(guī)模最大的鋼鐵企業(yè),寶鋼股份與華為雲深度合作,將盤(pán)古大模型應(yīng)用於高爐場(chǎng)景,對(duì)爐溫、鐵水溫度、矽含量等爐況進(jìn)行仿真,從而輔助高爐精準(zhǔn)控制,充分利用每一分能源,降低能源成本。
面對(duì)多維數(shù)據(jù)複雜度高的難題,華為雲採用頻域多尺度算法,讓模型更加魯棒;為了解決高時(shí)滯多時(shí)滯耦合問(wèn)題,華為雲以時(shí)序信息增強(qiáng)算法來(lái)捕捉時(shí)序關(guān)係;為了減少採集數(shù)據(jù)誤差,華為雲採用機(jī)理+數(shù)據(jù)融合驅動(dòng)預測(cè)模型,二者並行交叉驗(yàn)證,顯著增強(qiáng)模型精度。
實(shí)踐表明,高爐每降低10℃的溫度波動(dòng),每噸鐵水可減少1kg焦炭消耗,成本約降3元。基於盤(pán)古大模型高爐爐況預測(cè),指導(dǎo)高爐生產(chǎn)調(diào)控,能大幅提升爐內(nèi)工況的穩(wěn)定性,預計(jì)每年可為寶鋼降本逾10億元。
盤(pán)古大模型上線(xiàn)寶武鋼鐵集團(tuán)1880熱軋生產(chǎn)線(xiàn)
此外,上海寶武鋼鐵熱軋生產(chǎn)線(xiàn)每次調(diào)整生產(chǎn)鋼板的種類(lèi)和尺寸,都需要工程師重新優(yōu)化7道精軋機(jī)組的300多個(gè)參數(shù),耗時(shí)約5天。盤(pán)古大模型能對(duì)最優(yōu)參數(shù)進(jìn)行預測(cè),顯著降低熱軋生產(chǎn)線(xiàn)調(diào)優(yōu)時(shí)間,並提高預測(cè)精度和鋼板成材率。目前,盤(pán)古大模型已在寶鋼1880熱軋生產(chǎn)線(xiàn)上線(xiàn),預測(cè)精度提高5%以上,鋼板成材率提升0.5%,預計(jì)每年可多產(chǎn)鋼板2萬(wàn)餘噸,年收益達(dá)9000餘萬(wàn)元。
若以複雜性衡量應(yīng)用場(chǎng)景的AI落地難度,鋼鐵行業(yè)的高爐場(chǎng)景、熱軋場(chǎng)景只是冰山一角,高鐵行業(yè)的故障檢測(cè)、氣象領(lǐng)域的高解析度預報(bào)等場(chǎng)景同樣蘊藏著世界級(jí)的高難挑戰。
在高鐵故障檢測(cè)場(chǎng)景,盤(pán)古高鐵大模型藉助一雙「盤(pán)古眼」,解決了巡檢工作量巨大、故障形態(tài)龐雜、高鐵場(chǎng)景故障樣本稀缺且開(kāi)發(fā)成本高等難題,能精準(zhǔn)識別一列動(dòng)車(chē)的3.2萬(wàn)個(gè)項(xiàng)點(diǎn),覆蓋8大類(lèi)、350+種複雜故障,故障識別準(zhǔn)確率可達(dá)99%,幫助高鐵提升運(yùn)營(yíng)效率,降低成本,減少人工在凌晨時(shí)段去巡檢的艱辛作業(yè)。
大型城市的高解析度氣象預報(bào)是公認(rèn)的高難度係數(shù)應(yīng)用。盤(pán)古氣象大模型是首個(gè)精度超過(guò)傳統(tǒng)數(shù)值預報(bào)方法的AI預測(cè)模型,能秒級(jí)提供全球氣象預報(bào),並通過(guò)融合區(qū)域高質(zhì)量氣象數(shù)據(jù)集不斷優(yōu)化預測(cè)能力,使降雨量預測(cè)精度增強(qiáng)20%。華為雲在解析度為25公裡的全球模型基礎(chǔ)上,融合區(qū)域高質(zhì)量氣象數(shù)據(jù)集,升級(jí)了解析度分別為1公裡、3公裡、5公裡的區(qū)域預報(bào)能力,包含氣溫、降雨、風(fēng)速等氣象要素。
高差異化與適應(yīng)性的「難」:大模型突圍傳統(tǒng)痛點(diǎn)和新興樊籬
如果說(shuō)高複雜性體現(xiàn)了「難」的深度,那麼千行萬(wàn)業(yè)數(shù)智化轉(zhuǎn)型帶來(lái)的差異化特徵則折射出「難」的廣(guǎng)度——大模型既要幫助傳統(tǒng)行業(yè)「重做一遍」,又必須探尋新興場(chǎng)景的破局之道,這需要其具備適應(yīng)不同環(huán)境的能力與全面均衡的水平。
相關(guān)統(tǒng)計(jì)顯示,目前國(guó)內(nèi)傳統(tǒng)行業(yè)中AI滲透率超過(guò)10%的只有電子等少數(shù)行業(yè),媒體、醫(yī)藥、石化等行業(yè)的滲透率在5%~10%,建築等行業(yè)則低於5%。大模型無(wú)疑是加速AI在傳統(tǒng)行業(yè)落地的助推器,但針對(duì)各個(gè)行業(yè)的需求痛點(diǎn)找到適宜的解決方案殊非易事。
以媒體行業(yè)為例:傳統(tǒng)的運(yùn)作方式已無(wú)法適應(yīng)新環(huán)境的要求,重塑內(nèi)容生產(chǎn)與應(yīng)用的新模式迫在眉睫。盤(pán)古媒體大模型以語音生成、視頻生成、AI翻譯等維度為突破口:在語音生成方面,只需幾句話(huà)、幾秒鐘的聲音,即可實(shí)現(xiàn)個(gè)性化語音生成以及情感化表達(dá);在視頻生成方面,通過(guò)訓(xùn)練幾十張特定美學(xué)風(fēng)格的圖片,輸(shū)入實(shí)拍視頻即可按需時(shí)長(zhǎng)生成穩(wěn)定的動(dòng)漫視頻;在AI翻譯方面,可保留原始角色的音色、情感、語氣,並藉助AI將視頻翻譯為目標(biāo)語言。
不難看出,大模型正在為傳統(tǒng)行業(yè)提供嶄新的生產(chǎn)力工具,很多行業(yè)的「玩法」將由此徹底改變。在歷史悠久的建築與工業(yè)設(shè)計(jì)等領(lǐng)域,盤(pán)古大模型的「魔法棒」同樣大顯神威:依託可控高質(zhì)量視頻生成和3D重建等關(guān)鍵技術(shù),盤(pán)古大模型為建築設(shè)計(jì)構(gòu)建全新的解決方案,並讓工業(yè)設(shè)計(jì)的3D建模生成質(zhì)量實(shí)現(xiàn)從玩具級(jí)到工業(yè)級(jí)的蛻變。
與對(duì)傳統(tǒng)行業(yè)「點(diǎn)石成金」相比,大模型在新興應(yīng)用場(chǎng)景擁有更寬闊的舞臺(tái)。在自動(dòng)駕駛領(lǐng)域,盤(pán)古大模型重塑訓(xùn)練數(shù)據(jù)的積累方式,從過(guò)去的建模仿真升級(jí)到AI生成,讓自動(dòng)駕駛模型學(xué)習(xí)到更多的人類(lèi)駕駛規(guī)律,更好地應(yīng)對(duì)複雜的行車(chē)環(huán)境,解決了自動(dòng)駕駛數(shù)據(jù)集泛化生成、難例生成等業(yè)界難題。
按照難度級(jí)別劃(huà)分新興場(chǎng)景,具身智能堪稱(chēng)通用人工智慧的終極形態(tài),是大模型想要摘取的「皇冠上的明珠」。盤(pán)古具身智能大模型以雲助端,一腦多形,賦能端側機(jī)器人設(shè)備。它能讓機(jī)器人完成10步以上的複雜任務(wù)規(guī)劃(huà),並在執(zhí)行中實(shí)現(xiàn)多場(chǎng)景泛化和多任務(wù)處理。除了人形機(jī)器人,盤(pán)古具身智能大模型還賦能多種形態(tài)的工業(yè)機(jī)器人和服務(wù)機(jī)器人,更具顛覆性的未來(lái)圖景值得期待。
高創(chuàng)新性的「難」:大模型探索底座升級(jí)與方案落地新路徑
從某種意義上講,大模型的底層創(chuàng)新能力將決定其向上的高度。只有核心技術(shù)與落地路徑兩(liǎng)個(gè)維度相輔相成,才能充分釋放大模型的潛能,為千行萬(wàn)業(yè)的數(shù)智化躍遷提供最佳底座。
早在2021年4月,華為雲就正式發(fā)布包括NLP和CV兩(liǎng)種形態(tài)的盤(pán)古大模型,此時(shí)距離生成式AI火爆全球還有一年半的時(shí)間。其後,華為雲又推出科學(xué)計(jì)算大模型、藥物分子大模型、礦山大模型、氣象大模型,集大成的盤(pán)古大模型3.0於2023年7月問(wèn)世。
顯而易見(jiàn),盤(pán)古大模型始終扮演著引領(lǐng)者的角色,每一次創(chuàng)新突破都是大模型進(jìn)化的風(fēng)向標(biāo)。近日,華為雲重磅發(fā)布盤(pán)古大模型5.0,實(shí)現(xiàn)全系列、多模態(tài)、強(qiáng)思維三大創(chuàng)新升級(jí),繼續(xù)在「難而正確」的道路上邁出堅(jiān)實(shí)的一大步。
全系列是大模型適配紛繁業(yè)務(wù)場(chǎng)景的不二之選。盤(pán)古5.0以不同參數(shù)規(guī)格的模型滿(mǎn)足各類(lèi)場(chǎng)景需求:十億級(jí)參數(shù)的Pangu E系列可支撐手機(jī)、PC等端側的智能應(yīng)用;百億級(jí)參數(shù)的Pangu P系列單卡可推,適用於低時(shí)延的推理場(chǎng)景;千億級(jí)參數(shù)的Pangu U系列適用於處理複雜任務(wù);萬(wàn)億級(jí)參數(shù)的Pangu S系列超級(jí)大模型能幫助企業(yè)處理更為複雜的跨領(lǐng)域多任務(wù)。
多模態(tài)是大模型精準(zhǔn)理解和重構(gòu)物理世界的必由之路。盤(pán)古大模型5.0能更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高解析度;在內(nèi)容生成方面,採用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時(shí)空生成)技術(shù),聚焦自動(dòng)駕駛、工業(yè)製造、建築等多個(gè)行業(yè)場(chǎng)景,可生成更符合物理規(guī)律的多模態(tài)內(nèi)容。
強(qiáng)思維是大模型真正成為行業(yè)助手的關(guān)鍵要素。盤(pán)古5.0將思維鏈技術(shù)與策略搜索深度結(jié)合,顯著提升數(shù)學(xué)能力、複雜任務(wù)規(guī)劃(huà)能力和工具調(diào)用能力。思維鏈可幫助智能體更好地理解和預測(cè)環(huán)境變化,而策略搜索則是智能體適應(yīng)這些變化並做出決策的過(guò)程。兩(liǎng)者共同作用,將促使企業(yè)客戶(hù)能在複雜環(huán)境中進(jìn)行有效的學(xué)習(xí)和決策。
從AI落地的角度看,大模型底層能力的躍升固然具有決定性作用,但部署方式和落地路徑的優(yōu)化同樣不可或缺。在華為開(kāi)發(fā)者大會(huì)2024期間,華為雲開(kāi)創(chuàng)性地推出大模型混合雲十大創(chuàng)新技術(shù),藉助AI-Native存儲(chǔ)、增強(qiáng)AI網(wǎng)絡(luò)、算子加速、多樣性算力調(diào)度、雲邊協(xié)同、數(shù)據(jù)工程、統(tǒng)一數(shù)據(jù)編碼、精細(xì)視覺神經(jīng)網(wǎng)絡(luò)、無(wú)感斷點(diǎn)續(xù)訓(xùn)、安全護(hù)欄等方面的協(xié)同發(fā)力,打通大模型應(yīng)用落地進(jìn)程中的主要堵點(diǎn),為行業(yè)智能化之旅掃清了「最後一公裡」的障礙。
人間正道是滄桑。在「難而正確」的漫漫徵途上,難免還會(huì)有荊棘或險(xiǎn)灘,而以盤(pán)古大模型為代表的開(kāi)路先鋒將篳路藍(lán)縷以啟山林,櫛風(fēng)沐雨砥礪前行。多年以後,站在行業(yè)智能化的高峰迴望來(lái)時(shí)路,大模型留下的腳印會(huì)是最美的風(fēng)景。